In this work, we estimate the depth in which domestic waste are located in space from a mobile robot in outdoor scenarios. As we are doing this calculus on a broad range of space (0.3 - 6.0 m), we use RGB-D camera and LiDAR fusion. With this aim and range, we compare several methods such as average, nearest, median and center point, applied to those which are inside a reduced or non-reduced Bounding Box (BB). These BB are obtained from segmentation and detection methods which are representative of these techniques like Yolact, SOLO, You Only Look Once (YOLO)v5, YOLOv6 and YOLOv7. Results shown that, applying a detection method with the average technique and a reduction of BB of 40%, returns the same output as segmenting the object and applying the average method. Indeed, the detection method is faster and lighter in comparison with the segmentation one. The committed median error in the conducted experiments was 0.0298 ${\pm}$ 0.0544 m.
translated by 谷歌翻译
基于航空图像的地图中的本地化提供了许多优势,例如全球一致性,地理参考地图以及可公开访问数据的可用性。但是,从空中图像和板载传感器中可以观察到的地标是有限的。这导致数据关联期间的歧义或混叠。本文以高度信息的代表制(允许有效的数据关联)为基础,为解决这些歧义提供了完整的管道。它的核心是强大的自我调整数据关联,它根据测量的熵调整搜索区域。此外,为了平滑最终结果,我们将相关数据的信息矩阵调整为数据关联过程产生的相对变换的函数。我们评估了来自德国卡尔斯鲁厄市周围城市和农村场景的真实数据的方法。我们将最新的异常缓解方法与我们的自我调整方法进行了比较,这表明了相当大的改进,尤其是对于外部城市场景。
translated by 谷歌翻译
在本文中,我们为非结构化的户外环境提供了一个完整的自主导航管道。这项工作的主要贡献位于路径规划模块上,我们分为两个主要类别:全局路径规划(GPP)和本地路径规划(LPP)。对于环境表示,而不是复杂和重型网格图,GPP层使用直接从OpenStreetMaps(OSM)获得的道路网络信息。在LPP层中,我们使用新颖的天真谷路(NVP)方法来生成局部路径,避免实时障碍物。这种方法使用LIDAR传感器使用本地环境的天真表示。此外,它使用了一个天真的优化,用于利用成本图中的“谷”区域的概念。我们在研究平台蓝色实验上实验展示了该系统的稳健性,在阿利坎特大学科学园区自主驾驶超过20公里,在12.33公顷地区。
translated by 谷歌翻译
Reinforcement learning is a machine learning approach based on behavioral psychology. It is focused on learning agents that can acquire knowledge and learn to carry out new tasks by interacting with the environment. However, a problem occurs when reinforcement learning is used in critical contexts where the users of the system need to have more information and reliability for the actions executed by an agent. In this regard, explainable reinforcement learning seeks to provide to an agent in training with methods in order to explain its behavior in such a way that users with no experience in machine learning could understand the agent's behavior. One of these is the memory-based explainable reinforcement learning method that is used to compute probabilities of success for each state-action pair using an episodic memory. In this work, we propose to make use of the memory-based explainable reinforcement learning method in a hierarchical environment composed of sub-tasks that need to be first addressed to solve a more complex task. The end goal is to verify if it is possible to provide to the agent the ability to explain its actions in the global task as well as in the sub-tasks. The results obtained showed that it is possible to use the memory-based method in hierarchical environments with high-level tasks and compute the probabilities of success to be used as a basis for explaining the agent's behavior.
translated by 谷歌翻译
对制造工艺的机器化的需求很大,因此单调劳动。一些需要特定技能的制造任务(焊接,绘画等)缺乏工人。机器人已在这些任务中使用,但是它们的灵活性受到限制,因为它们仍然很难通过非专家编程/重新编程,从而使它们无法访问大多数公司。机器人离线编程(OLP)是可靠的。但是,直接来自CAD/CAM的生成路径不包括代表人类技能的相关参数,例如机器人最终效应器的方向和速度。本文提出了一个直观的机器人编程系统,以捕捉人类制造技能并将其转变为机器人程序。使用连接到工作工具的磁跟踪系统记录人类熟练工人的演示。收集的数据包括工作路径的方向和速度。位置数据是从CAD/CAM中提取的,因为磁跟踪器捕获时的误差很明显。路径姿势在笛卡尔空间中转换,并在模拟环境中进行验证。生成机器人程序并将其转移到真正的机器人。关于玻璃粘合剂应用过程的实验证明了拟议框架捕获人类技能并将其转移到机器人方面的使用和有效性的直觉。
translated by 谷歌翻译
深度学习(DL)技术被回归问题所接受。最近在该领域发表的论文数量越来越多,包括调查和评论,表明,由于效率和具有高维数据的系统的良好精度,深层回归引起了社区的关注。但是,许多DL方法具有复杂的结构,这些结构对人类用户不易透明。访问这些模型的可解释性是解决敏感领域问题(例如网络安全系统,医疗,金融监视和工业过程)的重要因素。模糊逻辑系统(FLS)是可解释的模型,在文献中众所周知,能够通过具有成员资格学位的语言术语对复杂系统使用非线性表示,模仿了人类的思想。在可解释的人工智能的气氛中,有必要考虑开发智能模型的准确性和可解释性之间的权衡。本文旨在调查结合DL和FL的现有方法的最新方法,即深度模糊系统,以解决回归问题,配置当前在文献中尚不充分探索的主题,因此应进行全面调查。
translated by 谷歌翻译
可以使用具有快速有效分割网络的深度学习方法来实施医疗图像分割。单板计算机(SBC)由于内存和处理限制而难以用于训练深网。诸如Google Edge TPU之类的特定硬件使其适合使用复杂的预训练网络进行实时预测。在这项工作中,我们研究了两个SBC的性能,具有和不进行硬件加速度进行底面图像分割,尽管这项研究的结论可以通过其他类型的医学图像的深层神经网络应用于分割。为了测试硬件加速的好处,我们使用先前已发布的工作中的网络和数据集,并通过使用具有超声甲状腺图像的数据集进行测试来概括它们。我们在SBC中测量预测时间,并将其与基于云的TPU系统进行比较。结果表明,使用Edge TPU,机器学习加速SBC的可行性可加速光盘和杯赛分段,每图像可获得低于25毫秒的时间。
translated by 谷歌翻译
在自拍照上的增强现实或AR过滤器在社交媒体平台上已经非常受欢迎,用于各种应用程序,包括营销,娱乐和美学。鉴于AR面部过滤器的广泛采用以及面孔在我们的社会结构和关系中的重要性,科学界从心理,艺术和社会学的角度分析此类过滤器的影响增加了。但是,该领域的定量分析很少,这主要是由于缺乏具有应用AR过滤器的面部图像的公开数据集。大多数社交媒体平台的专有性,紧密的性质不允许用户,科学家和从业人员访问代码和可用AR面孔过滤器的详细信息。从这些平台上刮擦面孔以收集数据在道德上是不可接受的,因此应在研究中避免。在本文中,我们介绍了OpenFilter,这是一个灵活的框架,可在社交媒体平台上使用AR过滤器,可在现有的大量人体面孔上使用。此外,我们共享FairBeauty和B-LFW,这是公开可用的Fairface和LFW数据集的两个美化版本,我们概述了这些美化数据集的分析得出的见解。
translated by 谷歌翻译
自50年代后期以来,当发射第一个人造卫星时,居民太空物品(RSO)的数量已稳步增加。据估计,目前约有100万个大于1厘米的物体正在绕地球绕,只有30,000个,大于10厘米,目前正在跟踪。为了避免碰撞的链反应,称为凯斯勒综合征,必须准确跟踪和预测空间碎片和卫星的轨道是必不可少的。当前基于物理的方法在7天的预测中存在误差,在考虑大部分小于1米的空间碎片时,这是不够的。通常,这种故障是由于轨迹开始时空间对象状态周围的不确定性,在环境条件(例如大气阻力)中的预测错误以及RSO的质量或几何形状等特定的未知特征。利用数据驱动的技术,即机器学习,可以提高轨道预测准确性:通过得出未测量的对象的特征,改善非保守力的效果,并通过深度学习模型具有高度复杂的非复杂性非 - 的卓越抽象能力来建模线性系统。在这项调查中,我们概述了该领域正在完成的当前工作。
translated by 谷歌翻译
图像注册是一个研究领域,必须将图像进行比较和对齐,并与观点或摄像机特征独立进行对齐。在某些应用中(例如法医生物识别技术,卫星摄影或室外场景标识)经典图像注册系统由于比较的一个图像而失败,这代表了另一个图像的一小部分。例如,在法医掌上识别的情况下,通常只能找到一小部分棕榈印刷,但是在数据库中,整个棕榈印刷已被注册。经典图像注册方法行为不佳的主要原因是两个图像的显着点的量之间的差距,这与被视为离群值的点数有关。通常,当代表场景的微小部分的图像急剧旋转时,找到良好匹配的困难会增加。同样,就掌刻法医而言,很难先确定发现的微型棕榈印刷图像的方向。我们提出了一种旋转不变的注册方法,该方法明确考虑要匹配的图像是较大图像的一小部分。在两种不同的情况下,我们在实验上验证了我们的方法。棕榈印刷识别和室外图像注册。
translated by 谷歌翻译